Préférences continues pour la Sélection d’Actions

نویسندگان

Patricia Everaere

Emmanuelle Grislin-Le Strugeon

چکیده

Dans cet article, nous avons expérimenté l’utilisation d’alternatives continues pour la sélection des actions d’un agent orienté comportement. Un tel agent est constitué de "comportements" concurrents, chacun de ces comportements réagit à des stimuli spécifiques et propose une action, en accord avec un but élémentaire. Comme les comportements sont spécialisés, ils peuvent proposer des actions concurrentes et en conflit avec les autres actions, alors qu’il est nécessaire de déterminer un comportement global cohérent de l’agent. Dans ce contexte, les méthodes de vote permettent de sélectionner une action parmi celle proposées par les comportements, tout en tenant compte de leurs préférences et en respectant leur contraintes. Les travaux précédents sont basés sur des espaces d’action limités à quelques valeurs discrètes, et la détermination des poids des votes des comportements est difficile. De plus ces travaux ne permettent pas en général d’exprimer l’indifférence en une des composantes des alternatives, c’est-à-dire le fait qu’un comportement n’ait pas de préférence sur la valeur d’une des composante de l’action. Nous proposons dans cet article une méthode permettant d’utiliser des domaines continus dans les alternatives, et une méthode de vote plus équitable que dans les travaux précédents. Notre approche permet également l’expression de l’indifférence entre alternatives. Cette proposition a été testée et comparée, les résultats montrent que cette méthode permet de mieux éviter les situations de blocage.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Sélection de modèles et sélection d'estimateurs pour l'Apprentissage statistique (Cours Peccot) Quatrième cours: Validation croisée et pénalités reliées

1. Validation croisée 1 1.1. Principe et dé nition générale 2 1.2. Exemples 2 1.3. Estimation du risque par validation croisée 4 2. Validation croisée pour la sélection d'estimateurs 5 2.1. Sélection d'estimateurs pour la prédiction 5 2.2. Sélection d'estimateurs pour l'identi cation 6 2.3. Choix d'une méthode de validation croisée 6 2.4. Limites de la validation croisée 6 3. Détection de ruptu...

متن کامل

Sélection de modèles et sélection d’estimateurs pour l’Apprentissage statistique (Cours Peccot) Premier cours: Apprentissage statistique et sélection d’estimateurs

1. Le problème de l’apprentissage statistique 2 1.1. Cadre général 2 1.2. Exemple : prédiction 2 1.3. Exemple : régression 2 1.4. Exemple alternatif : régression sur un plan d’expérience fixe 3 1.5. Autres exemples 4 2. Estimateurs 4 2.1. Définition générale 4 2.2. Consistance, No Free Lunch 5 2.3. Exemples : Estimateurs par minimum de contraste 5 2.4. Exemple : Estimateurs des moindres carrés ...

متن کامل

Classification des actions humaines basée sur les descripteurs spatio-temporels

Résumé. Dans cet article, nous proposons un nouveau descripteur spatio-temporel appelé ST-SURF pour l’analyse et la reconnaissance d’actions dans des flux vidéo. L’idée principale est d’enrichir le descripteur Speed Up Robust Feature (SURF) en intégrant l’information de mouvement issue du flot optique. Seuls les points d’intérêts qui ont subi un déplacement sont pris en compte pour générer un d...

متن کامل

Sélection de modèles et sélection d’estimateurs pour l’Apprentissage statistique (Cours Peccot) Troisième cours: Rééchantillonnage et pénalisation

1. Régressogrammes en régression hétéroscédastique 2 1.1. Cadre de la régression hétéroscédastique 2 1.2. Régressogrammes 2 1.3. Exemples de collections de partitions 4 1.4. Pénalité idéale 4 2. Nécessité d’estimer la forme de la pénalité 7 2.1. Illustration sur un exemple 7 2.2. Caractérisation des pénalités fonction de la dimension 8 2.3. Sous-optimalité des pénalités fonction de la dimension...

متن کامل

Sélection d’a priori et géométrie de l’information

Dans cette contribution, nous étudions le problème de la sélection de distribution a priori dans le contexte de la théorie bayésienne. La litérature sur le sujet est abondante et le problème est loin d’être définitivement résolu [1]. Nous revisitons cette problématique avec les outils de la géométrie différentielle pour proposer une construction de l’a priori dans le cadre de la théorie bayésie...

متن کامل

ذخیره در منابع من

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره شماره

صفحات -

تاریخ انتشار 2012

Préférences continues pour la Sélection d’Actions

نویسندگان

چکیده

منابع مشابه

Sélection de modèles et sélection d'estimateurs pour l'Apprentissage statistique (Cours Peccot) Quatrième cours: Validation croisée et pénalités reliées

Sélection de modèles et sélection d’estimateurs pour l’Apprentissage statistique (Cours Peccot) Premier cours: Apprentissage statistique et sélection d’estimateurs

Classification des actions humaines basée sur les descripteurs spatio-temporels

Sélection de modèles et sélection d’estimateurs pour l’Apprentissage statistique (Cours Peccot) Troisième cours: Rééchantillonnage et pénalisation

Sélection d’a priori et géométrie de l’information

عنوان ژورنال:

اشتراک گذاری